看完不会来揍我

您所在的位置:网站首页 森林图的详细解读 p值怎么算 看完不会来揍我

看完不会来揍我

2024-06-01 02:23| 来源: 网络整理| 查看: 265

最近真的是超超超超超超超级多的小伙伴们在咨询孟德尔随机化相关的问题和课程,意想不到的那种多!那我怎么办嘞!整呗!主打的就是一个宠粉!

关于孟德尔随机化,我们之前就已经在孟德尔随机化(一)| 随处可见的孟德尔随机化到底是什么?中介绍过啦!对孟德尔随机化的理解还比较模糊的小伙伴可以去看看,说不定会有帮助哟!实操部分一直说要更新的,结果因为最近在忙毕业的事情,所以就拖到现在啦!抱歉抱歉啦!现在它终于要出场啦!咱们今天,就尽力给大家把孟德尔随机化讲透咯!让我们每个人都能够亲手做出自己的孟德尔随机化!

如果小伙伴们有需求的话,可以加入我们的交流群:一定要知道 | 永久免费的环境友好型生信学习交流群又双叒叕来啦!| 伴随不定期群友好物分享!在这里,你可以稍有克制地畅所欲言!

超级建议大家在入群前或入群后可以看一下这个:干货满满 | 给生信小白的入门小建议 | 掏心掏肺版!绝对干货满满!让你不虚此看!

如果有需要个性化定制分析服务的小伙伴,可以看看这里:你要的个性化生信分析服务今天正式开启啦!定制你的专属解决方案!全程1v1答疑!!绝对包你满意!

咱们直接开始边实操边讲解!冲冲冲!!!

分析流程

我们先大致了解一下进行**孟德尔随机化(Mendelian Randomization,MR)**的工作流程(里面有些词不理解没关系,咱们下面会详细介绍),如下所示:

为暴露选择工具变量(如有需要进行连锁不平衡(Linkage Disequilibrium,LD)clumping);从 IEU(https://gwas.mrcieu.ac.uk/)GWAS 数据库提取与感兴趣的结局相关的工具变量(除了这个数据库,还有其他数据库也可以,但只有这个数据库的数据可以直接用TwoSampleMR包获取,从其他数据库或者相关文献拿到的数据需要我们对其进行相应处理,咱们后面都会介绍的,大家不要担心!);协调或整合暴露数据和结局数据;进行 MR 分析、敏感性分析、绘制图表、报告撰写等等等等。

下面是官网的示意图:

上面是对 MR 分析整体的概览,咱们现在开始掰开了揉碎了介绍喽!

工具变量的获取 从 GWAS 相关文献获取

示例文献:Novel loci affecting iron homeostasis and their effects in individuals at risk for hemochromatosis | Nature Communications(https://www.nature.com/articles/ncomms5926)

像这种得到的显著 SNP 位点不多的研究,它会把数据放在正文中,我们直接拿来用就好啦!别忘了引用!但是还需要注意一个问题,有些文章中展示的位点,虽然是显著的,但它们不一定相互独立(咱 MR 分析的基本条件嘛),如果这样的话,我们就需要再给它去除一下连锁不平衡。

从 MR 相关文献中获取

示例文献:Gout and the risk of Alzheimer′s disease: A Mendelian randomization study - Lee - 2019 - International Journal of Rheumatic Diseases - Wiley Online Library(https://onlinelibrary.wiley.com/doi/10.1111/1756-185X.13548)

不过,感觉它们多数也是从 IEU(https://gwas.mrcieu.ac.uk/)GWAS 数据库中拿到的。个人建议哈,最好还是咱们自己从原始数据出发开始处理,毕竟,万一个别文章分析过程有问题呢 🌚

利用 TwoSampleMR 包直接获取

咱们今天就主要介绍这种!请看下文!从文献中获取的数据的处理方法我们后面也会详细介绍滴!

TwoSampleMR 包的安装

那我们开始安装包!

############################ 孟德尔随机化 ############################ # 首先安装包 devtools::install_github("MRCIEU/TwoSampleMR") # 或者也可以使用官方安装代码,其实都差不多的啦! # 咱们在R包的下载与安装一文中也有详细介绍,有兴趣的小伙伴可以查看:https://mp.weixin.qq.com/s/jkCzmjTw_ILw4jTfaW7NpQ # install.packages("remotes") # remotes::install_github("MRCIEU/TwoSampleMR")

这里的包需要从 GitHub 进行下载安装,如果遇到 token 设置或者其他问题,大家可以查看:看完不会来揍我 | R包的下载与安装 | 再也没有一个包可以逃出你的手掌心啦,绝对保真!看完这篇,大概率是没有包能够逃出你的手掌心啦哈哈哈哈哈哈哈哈!

安装TwoSampleMR包的时候,它会帮助我们同时安装其他辅助包,有时候会提示我们是否需要更新其他包(提示可能不止一次,而且这个包安装需要一些时间,大家不要急,咱慢慢来!),咱们一般选3不更新就好啦!至于包是否需要经常更新,咱们主打一个能不更新就不更新!想了解详情的小伙伴也可以继续查看:看完不会来揍我 | R包的下载与安装 | 再也没有一个包可以逃出你的手掌心啦!

包安装好之后,我们就可以开始准备数据啦!

数据准备

使用 TwoSampleMR 包进行 MR 分析时,通常需要两个关键的数据集:一个用于估计遗传变异与暴露因子的关系(关联分析),另一个用于估计遗传变异与结局的关系(效应量估计)。接下来,咱们就来看看要怎么获取它们叭!

我有点好奇教育水平(educational attainment)和乳腺癌(breast cancer)之间是不是存在一些奇妙的关联,毕竟阿巴阿巴你懂的哈哈哈哈哈哈哈哈!(我就随脑子那么一想!大家随意发挥!)

注意注意:咱们这里先演示的是直接通过TwoSampleMR包下载数据并对其进行处理,如果是从文献中获取的数据,处理方式咱们后面演示好不好!

那么我们如何获取暴露因子(这里我们就指教育水平叭)和结局变量(这里指乳腺癌)的 SNP 数据呢?通常,这些数据可以从多个 GWAS 数据库或文献中获取。我们今天使用IEU 数据库(https://gwas.mrcieu.ac.uk/),这个数据库的优点是它允许我们直接通过TwoSampleMR包下载所需的数据,是不是超方便!

IEU数据库界面如下:

我们可以直接在中间的大框框里输入关键词,也可以点击右上角的datasets进入新的页面,在Trait contains的框框里输入关键词。比如我们这里就以educational attainment(教育水平)作为关键词进行输入,然后点击🔍或者Filter,就会看到有很多数据被筛选出来啦(虽然这里没有很多哈哈哈哈哈哈)!

这里我们选择ebi-a-GCST90029012这个数据。

点击上图的红色箭头,我们还可以进入数据详情界面,如下图所示:

接下来,我们再找乳腺癌(breast cancer)相关数据,以breast cancer为关键词进行输入,筛选得到下面的数据,我们选择ukb-b-16890这个数据进行后续分析。

所以嘞,咱们研究教育水平(educational attainment)对乳腺癌(breast cancer)的影响,就需要下载前面提到的ebi-a-GCST90029012和ukb-b-16890这两个数据,咱们用TwoSampleMR包进行下载。

获取暴露因子的 SNP 数据 # 加载包 library(TwoSampleMR) # 下载暴露数据 exposure_data


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3